Переход от NVIDIA GT200 к архитектуре Fermi означает рождение третьего поколения вычислений на видеопроцессорах. В то время как предыдущие архитектуры были первоначально ориентированы на графику и «подгонялись» под математические задачи, архитектура Fermi была создана с нуля для GPGPU (видеопроцессор общего назначения) приложений.
1. От графики к вычислениям
В отличие от GT200, который был ориентирован на текстурные блоки и жесткую параллельную обработку данных, архитектура Fermi ввела единый путь запроса к памяти. Этот сдвиг позволил реализовать компьютерное мышление, что дало разработчикам возможность перейти от простых двумерных сеток к сложным алгоритмам на языке С++.
2. Прорыв в иерархии памяти
Архитектура Fermi ввела настоящую иерархию кэш-памяти L1/L2 и соответствие стандарту IEEE 754-2008 плавающей точки. Это означало, что исследователям больше не нужно было вручную управлять «рабочей памятью» (общей памятью) для каждого байта, что позволило использовать неправильные структуры данных и точность двойной точности, необходимую для научно-инженерных расчетов.